马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死
马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了。
搜索
OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了。
Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。
没错,大洗牌之后,xAI紧锣密鼓地发上重磅新品了——首个Coding Agent,Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁,属于是摆在明面上的。
随着代码智能从 code foundation models 走向 autonomous coding agents,CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。
DeepSeek也有自己专属的Coding Agent了。名字简单粗暴,就叫DeepSeek-TUI,作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚,这个项目的星标数突然开始骤增,来到了2.3k,还登上了GitHub热榜。
今天,智谱发布了一篇名为《Scaling Pain:超大规模Coding Agent推理实践》的技术报告,披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。
OpenAI工程师公开发帖承认:哪怕用的是Codex,一个人能有效监督的coding agent也就3到5个,再多生产率直接往下掉。更劲爆的是,OpenAI没有选择"让人盯更多屏幕",而是直接开源了Symphony——一套把人类从"实时盯盘"解放成"异步验收"的全新工作流系统。近40万人围观,近3000人收藏。
随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。
在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它们究竟是什么、工作原理如何,以及在实际应用中各组件是如何协同运作的。
OpenAI宣布更新ChatGPT Pro与Plus订阅套餐,以更好地支持Codex(旗下AI Coding Agent)日益增长的使用需求。此次OpenAI新增每月100美元Pro版,该等级Codex的使用量是Plus版本的五倍,适合长时间、高强度的Codex会话。